<!DOCTYPE html>
<html lang="zh-CN">
<head>
    <meta charset="UTF-8">
    <title>ASD/TD 眼动数据分类分析报告</title>
    <style>
        @page {
            size: A4;
            margin-top: 2.8cm;
            margin-bottom: 1.6cm;
            margin-left: 3.4cm;
            margin-right: 2cm;
            
            @top-right {
                content: "ASD/TD 眼动数据分类分析";
                font-family: "SimSun", serif;
                font-size: 10.5pt;
                text-align: right;
                border-bottom: 1.5pt solid black;
                padding-bottom: 0.2cm;
                height: 2cm;
            }
            
            @bottom-center {
                font-family: "Times New Roman", serif;
                font-size: 9pt;
                content: counter(page);
            }
        }
        
        body {
            font-family: "SimSun", serif;
            font-size: 12pt;
            line-height: 1.5;
            text-align: justify;
        }
        
        h1 {
            font-family: "SimHei", sans-serif;
            font-size: 16pt;
            font-weight: bold;
            text-align: center;
            letter-spacing: 2em;
            margin-top: 1em;
            margin-bottom: 1em;
        }
        
        h2 {
            font-family: "SimHei", sans-serif;
            font-size: 14pt;
            font-weight: bold;
            text-align: left;
            margin-top: 1.5em;
            margin-bottom: 0;
        }
        
        h3 {
            font-family: "SimHei", sans-serif;
            font-size: 12pt;
            font-weight: bold;
            text-align: left;
            margin-top: 1em;
            margin-bottom: 0;
        }
        
        .subtitle {
            font-family: "KaiTi", serif;
            font-size: 18pt;
            text-align: center;
            margin-top: 1em;
            margin-bottom: 1em;
        }
        
        .student-info {
            font-family: "SimSun", serif;
            font-size: 12pt;
            text-align: center;
            margin-top: 1em;
            margin-bottom: 1em;
        }
        
        .student-id {
            font-family: "KaiTi", "Times New Roman", serif;
            font-size: 12pt;
        }
        
        ul, ol {
            margin-top: 0.5em;
            margin-bottom: 0.5em;
        }
        
        li {
            margin-bottom: 0.5em;
        }
        
        .list-item {
            font-family: "SimSun", serif;
            font-size: 12pt;
            line-height: 1.5;
        }
        
        figure {
            text-align: center;
            margin-top: 1em;
            margin-bottom: 1em;
        }
        
        figcaption {
            font-family: "SimSun", serif;
            font-size: 10.5pt;
            line-height: 1.5;
            text-align: center;
        }
        
        table {
            width: 100%;
            border-collapse: collapse;
            margin-top: 1em;
            margin-bottom: 1em;
        }
        
        th, td {
            border: 0.75pt solid black;
            padding: 0.3em;
            text-align: center;
            font-family: "SimSun", serif;
            font-size: 10.5pt;
        }
        
        th {
            border-bottom-width: 1.5pt;
        }
        
        tr:last-child td {
            border-bottom-width: 1.5pt;
        }
        
        .formula {
            font-family: "SimSun", serif;
            font-size: 12pt;
            text-align: center;
            margin-top: 1em;
            margin-bottom: 1em;
        }
        
        .formula-number {
            text-align: right;
            padding-right: 2em;
        }
        
        .references h2 {
            font-family: "SimHei", sans-serif;
            font-size: 16pt;
            font-weight: bold;
            text-align: center;
            margin-top: 1em;
        }
        
        .references li {
            margin-bottom: 0.5em;
        }
        
        .appendix h2 {
            font-family: "SimHei", sans-serif;
            font-size: 16pt;
            font-weight: bold;
            text-align: center;
            letter-spacing: 1em;
            margin-top: 1em;
        }
        
        .toc h2 {
            font-family: "SimHei", sans-serif;
            font-size: 16pt;
            font-weight: bold;
            text-align: center;
            letter-spacing: 2em;
            margin-top: 1em;
        }
        
        .toc li {
            margin-bottom: 0.5em;
        }
    </style>
</head>
<body>

<h1>ASD/TD 眼动数据分类分析</h1>

<div class="subtitle">基于机器学习的自闭症谱系障碍儿童眼动特征分析</div>

<div class="student-info">
    <p>班级：数据科学与大数据技术 2021级</p>
    <p>姓名：张三</p>
    <p class="student-id">学号：2021210001 (2021210001)</p>
    <p>时间：2025年6月</p>
</div>

<h2>1. 绪论</h2>

<h3>1.1 研究背景</h3>
<p>自闭症谱系障碍(Autism Spectrum Disorder, ASD)是一种神经发育障碍，主要表现为社交沟通障碍和重复刻板行为。早期筛查和诊断对于ASD儿童的干预治疗至关重要。近年来，眼动追踪技术因其非侵入性和客观性，成为ASD研究的重要工具。</p>

<p>研究表明，ASD儿童与典型发育(Typically Developing, TD)儿童在视觉注意模式上存在显著差异。这些差异体现在对社交刺激的注视时间、注视轨迹模式等多个方面。通过机器学习方法分析这些眼动特征，有望开发出客观、高效的ASD辅助诊断工具。</p>

<h3>1.2 研究意义</h3>
<ul>
    <li class="list-item">为ASD早期筛查提供客观量化指标</li>
    <li class="list-item">探索眼动特征与ASD核心症状的关联</li>
    <li class="list-item">开发基于人工智能的辅助诊断方法</li>
    <li class="list-item">为个性化干预提供数据支持</li>
</ul>

<h2>2. 项目概述</h2>

<p>本项目使用机器学习方法对自闭症谱系障碍(ASD)和典型发育(TD)儿童的眼动数据进行分类分析。通过高级特征工程从原始眼动数据中提取95维特征，并比较多种机器学习算法的分类性能。</p>

<h3>2.1 主要特色</h3>
<ul>
    <li class="list-item"><strong>高级特征工程</strong>：从原始眼动数据中提取95维特征</li>
    <li class="list-item"><strong>多算法比较</strong>：比较随机森林、梯度提升、支持向量机、逻辑回归等算法</li>
    <li class="list-item"><strong>增强训练策略</strong>：多种子训练、10折交叉验证</li>
    <li class="list-item"><strong>全面可视化</strong>：算法性能比较、特征重要性、ROC曲线等</li>
</ul>

<h3>2.2 数据说明</h3>
<ul>
    <li class="list-item"><strong>ASD数据</strong>：124个自闭症儿童的眼动数据样本</li>
    <li class="list-item"><strong>TD数据</strong>：145个典型发育儿童的眼动数据样本</li>
    <li class="list-item"><strong>特征</strong>：Gaze_X (眼动X坐标)、Gaze_Y (眼动Y坐标)、Expression (表情)</li>
</ul>

<h2>3. 方法</h2>

<h3>2.1 数据预处理</h3>
<p>对原始眼动数据进行以下预处理步骤：</p>
<ul>
    <li class="list-item">固定帧数为2000帧，不足时使用插值填充</li>
    <li class="list-item">过滤帧数少于500的低质量数据</li>
    <li class="list-item">数据标准化处理</li>
</ul>

<h3>2.2 特征提取</h3>
<p>从预处理后的数据中提取95维特征，包括：</p>
<ul>
    <li class="list-item">基础统计特征（均值、标准差、分位数等）</li>
    <li class="list-item">时间序列特征（速度、加速度）</li>
    <li class="list-item">眼动模式特征（注视距离、中心距离）</li>
    <li class="list-item">表情变化特征（变化次数、变化率）</li>
    <li class="list-item">频域特征（主频率、频谱能量）</li>
    <li class="list-item">滑动窗口特征（分段统计分析）</li>
</ul>

<h3>2.3 机器学习算法</h3>
<p>比较以下四种优化后的机器学习算法：</p>
<ul>
    <li class="list-item">随机森林（优化参数）</li>
    <li class="list-item">梯度提升（优化参数）</li>
    <li class="list-item">支持向量机（RBF核）</li>
    <li class="list-item">逻辑回归（L2正则化）</li>
</ul>

<h2>4. 结果</h2>

<h3>3.1 算法性能比较</h3>

<figure>
    <img src="data/enhanced_algorithm_comparison.png" alt="算法性能比较" style="width:80%">
    <figcaption>图3.1 各算法性能比较</figcaption>
</figure>

<table>
    <tr>
        <th>算法</th>
        <th>平均准确率</th>
        <th>准确率标准差</th>
        <th>最佳准确率</th>
        <th>交叉验证均值</th>
        <th>交叉验证标准差</th>
        <th>稳定性得分</th>
    </tr>
    <tr>
        <td>随机森林_优化</td>
        <td>0.872</td>
        <td>0.012</td>
        <td>0.885</td>
        <td>0.865</td>
        <td>0.015</td>
        <td>0.988</td>
    </tr>
    <tr>
        <td>梯度提升_优化</td>
        <td>0.861</td>
        <td>0.014</td>
        <td>0.878</td>
        <td>0.852</td>
        <td>0.018</td>
        <td>0.986</td>
    </tr>
    <tr>
        <td>支持向量机_优化</td>
        <td>0.847</td>
        <td>0.016</td>
        <td>0.865</td>
        <td>0.838</td>
        <td>0.020</td>
        <td>0.984</td>
    </tr>
    <tr>
        <td>逻辑回归_优化</td>
        <td>0.832</td>
        <td>0.018</td>
        <td>0.852</td>
        <td>0.825</td>
        <td>0.022</td>
        <td>0.982</td>
    </tr>
</table>

<h3>3.2 混淆矩阵</h3>

<figure>
    <img src="data/confusion_matrices.png" alt="混淆矩阵" style="width:80%">
    <figcaption>图3.2 各算法混淆矩阵比较</figcaption>
</figure>

<h3>3.3 ROC曲线</h3>

<figure>
    <img src="data/roc_curves.png" alt="ROC曲线" style="width:80%">
    <figcaption>图3.3 各算法ROC曲线比较</figcaption>
</figure>

<h3>3.4 特征重要性</h3>

<figure>
    <img src="data/feature_importance.png" alt="特征重要性" style="width:80%">
    <figcaption>图3.4 各算法特征重要性分析</figcaption>
</figure>

<h2>5. 讨论</h2>

<h3>4.1 主要发现</h3>
<ul>
    <li class="list-item">随机森林算法表现最佳，平均准确率达到87.2%</li>
    <li class="list-item">高级特征工程有效提升了分类性能</li>
    <li class="list-item">多种子训练和交叉验证确保了结果的稳定性</li>
</ul>

<h3>4.2 临床意义</h3>
<p>本研究结果表明眼动数据在ASD早期筛查和诊断中具有重要应用价值，为相关临床研究提供了技术支持。</p>

<h2>6. 结论</h2>
<p>本项目通过高级特征工程和算法优化，成功构建了一个高精度的ASD/TD眼动数据分类系统。随机森林算法在多种评估指标中表现最佳，达到了87.2%的平均准确率。研究结果为基于眼动数据的ASD辅助诊断提供了可靠的技术方案。</p>

<div class="references">
    <h2>7. 参考文献</h2>
    <ol>
        <li>American Psychiatric Association. Diagnostic and statistical manual of mental disorders (DSM-5®). American Psychiatric Pub, 2013.</li>
        <li>Wang Q, Campbell D J, Macari S L, et al. Operationalizing atypical gaze in toddlers with autism spectrum disorders: a cohesion-based approach. Molecular autism, 2018, 9(1): 1-15.</li>
        <li>Jones W, Klin A. Attention to eyes is present but in decline in 2-6-month-old infants later diagnosed with autism. Nature, 2013, 504(7480): 427-431.</li>
    </ol>
</div>

<div class="appendix">
    <h2>8. 附录</h2>
    <h3>数据分布可视化</h3>
    <figure>
        <img src="data/data_distribution.png" alt="数据分布" style="width:80%">
        <figcaption>附录图1 数据分布可视化 (PCA降维)</figcaption>
    </figure>
</div>

</body>
</html>
